#字体反爬虫 https://www.shixiseng.com/
#网站有自己的一套字体  乱码
#1.硬刚   正常字体：乱码   replace
#2.ttf字体文件   软件打开   映射   一键式生成{}  replace   手写

import requests
from  bs4 import BeautifulSoup

url='https://www.shixiseng.com/interns?keyword=python&city=%E5%85%A8%E5%9B%BD&type=intern'
headers={
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 Edg/109.0.1518.78'
}
html=requests.get(url,headers=headers)
soup=BeautifulSoup(html.text,'lxml')
lines=soup.select('.intern-wrap.intern-item div.f-l.intern-detail__job')
for line in lines:
    ps=line.select_one('p')
    name=ps.select_one('a').text.replace('','python')\
        .replace('','python')\
        .replace('','生').replace('','程').replace('','端')
    salary=ps.select_one('span').text.replace('','1').replace('','5').replace('','0').replace('','3')
    title=ps.select_one('a')['title'].replace('&#xf588','p')\
        .replace('&#xf2f0','y').replace('&#xe0f2','t').replace('&#xe48f','h').replace('&#xf193','o').\
        replace('&#xf745','n').replace('&#xe9ad','端').replace('&#xee92','P').replace('&#xe3d0','工').\
        replace('&#xea61','程').replace('&#xf0fd','师')
    print(f'职位:{name} 薪水:{salary} 标题:{title}')